جویشگر[?] یا موتور جستجو (به انگلیسی: Search Engine)، در فرهنگ رایانه، به طور عمومی به برنامهای گفته میشود که کلمات کلیدی را در یک سند یا بانک اطلاعاتی جستجو میکند. در اینترنت به برنامهای گفته میشود که کلمات کلیدی موجود در فایلها و سندهای وب جهانی، گروههای خبری، منوهای گوفر و آرشیوهای FTP را جستجو میکند.
برخی از جویشگرها برای تنها یک وبگاه(پایگاه وب) اینترنت به کار برده میشوند و در اصل جویشگری اختصاصی آن وبگاه هستند و تنها محتویات همان وبگاه را جستجو میکنند.
برخی دیگر نیز ممکن است با استفاده از SPIDERها محتویات وبگاههای زیادی را پیمایش کرده و چکیدهای از آن را در یک پایگاه اطلاعاتی به شکل شاخصگذاریشده نگهداری میکنند. کاربران سپس میتوانند با جستجو کردن در این پایگاه داده به پایگاه وبی که اطلاعات موردنظر آنها را در خود دارد پی ببرند.
جویشگرها به دو دسته کلی تقسیم میشوند. جویشگرهای پیمایشی (خودکار) و فهرستهای تکمیلدستی (غیر خودکار). هر کدام از آنها برای تکمیل فهرست خود از روشهای متفاوتی استفاده میکنند البته لازم به ذکر است که گونهای جدید از جویشگرها تحت عنوان «ابرجویشگر» (Meta Search Engines) نیز وجود دارد که در ادامه به توضیح هر یک از این موارد خواهیم پرداخت :
جویشگرهای پیمایشی (Crawler-Based Search Engines) مانند گوگل فهرست خود را بصورت خودکار تشکیل میدهند. آنها وب را پیمایش کرده، اطلاعاتی را ذخیره میکنند، سپس کاربران از میان این اطلاعات ذخیره شده، آنچه را که میخواهند جستجو میکنند. اگر شما در صفحه وب خود تغییراتی را اعمال نمایید، جویشگرهای پیمایشی آنها را به طور خودکار مییابند و سپس این تغییرات در فهرستها اعمال خواهد شد. عنوان، متن و دیگر عناصر صفحه، همگی در این فهرست قرار خواهند گرفت.وجه مشخصه این گروه از جویشگرها وجود نرمافزار موسوم به SPIDER در آنهاست. این شبه نرمافزار کوچک بصورت خودکار به کاوش در شبکه جهانی پرداخته و از پایگاههای وب یادداشتبرداری و فهرستبرداری میکند سپس این اطلاعات را برای تجزیه و تحلیل و طبقهبندی به بانک اطلاعاتی جویشگر تحویل میدهد.
فهرستهای دستنویسشده یا (Human-Powered Directories) مانند فهرست بازی (Open Directory) مانند Dmoz وابسته به کاربرانی است که آن را تکمیل میکنند. شما صفحه مورد نظر را به همراه توضیحی کوتاه در فهرست ثبت میکنید یا این کار توسط ویراستارهایی که برای آن فهرست در نظر گرفته شده، انجام میشود. عمل جستجو در این حالت تنها بر روی توضیحات ثبت شده صورت میگیرد و در صورت تغییر روی صفحه وب، روی فهرست تغییری به وجود نخواهد آورد. چیزهایی که برای بهبود یک فهرستبندی در یک جویشگر مفید هستند، تأثیری بر بهبود فهرستبندی یک دایرکتوری ندارند. تنها استثناء این است که یک سایت خوب با پایگاه دادهای با محتوای خوب شانس بیشتری نسبت به یک سایت با پایگاه داده ضعیف دارد. البته در مورد جویشگرهای مشهور مانند گوگل و یاهو، یک مولفه دیگر هم برای بهبود فهرستبندی وجود دارد که کمک مالی (یا به اصطلاح اسپانسر) است، یعنی وبگاههایی که مایل به بهبود مکان وبگاه خود در فهرست بندی هستند، میتوانند با پرداخت پول به این جویشگرها به هدف خویش برسند.
به موتورهایی گفته میشود که هر دو حالت را در کنار هم نمایش میدهند. غالباً، یک جویشگر ترکیبی در صورت نمایش نتیجه جستجو از هر یک از دستههای فوق، نتایج حاصل از دسته دیگر را هم مورد توجه قرار میدهد. مثلاً جویشگر ام.اس.ان (MSN) بیشتر نتایج حاصل از فهرستهای تکمیلدستی را نشان میدهد اما در کنار آن نیم نگاهی هم به نتایج حاصل از جستجوی پیمایشی دارد. ?
این گونه جدید از جویشگرها که قدمت چندانی نیز ندارند، بصورت همزمان از چندین جویشگر برای کاوش در شبکه برای کلید واژه مورد نظر استفاده میکنند. بدین معنی که این جویشگر عبارت مورد نظر شما را در چندین جویشگر ِ دیگر جستجو کرده و نتایج آنها را با هم ترکیب کرده و یک نتیجه کلی به شما ارائه میدهد. بهعنوان مثال جویشگر داگ پایل [?] از نتایج حاصل از موتورهای Google - Yahoo - MSN -ASKاستفاده کرده و نتیجه حاصله را به شما ارائه میدهد.لازم به ذکر است که روش و یا راهکار مشخص و یکسانی برای ترکیب نتایج حاصله از موتورهای پایه - موتورهایی که به عنوان جویشگر استفاده میشوند مانند Yahoo که یک موتور پایه برای dogpile میباشد - وجود ندارد.اما dogpile قابلیت جستجو به همه زبانها را نداردو ظاهرا فقط کلمات انگلیسی را پیدا میکند.
این گونه از جویشگرها، نسل جدید و متفاوتی از جویشگرهای گذشته هستند. امکان ثبت جستجو و مدلسازی فعالیتهای کاربر و ارائه? نتایج جدید بهکاربر، بهصورت متفاوت و تفکیک شده، از امکانات نوجویشگرها است.[نیازمند منبع]
جویشگرهای پیمایشی شامل سه عنصر اصلی هستند. اولی در اصطلاح عنکبوت (Spider) است که پیمایشگر (Crawler) هم نامیده میشود. پیمایشگر همین که به یک صفحه میرسد، آن را میخواند و سپس پیوندهای آن به صفحات دیگر را دنبال مینماید. این چیزیست که برای یک سایت پیمایششده (Crawled) اتفاق افتادهاست. پیمایشگر با یک روال منظم، مثلاً یک یا دو بار در ماه به سایت مراجعه میکند تا تغییرات موجود در آن را بیابد. هر چیزی که پیمایشگر بیابد به عنصر دوم یک جویشگر یعنی فهرست انتقال پیدا میکند. فهرست اغلب به کاتالوگی بزرگ اطلاق میشود که شامل لیستی از آنچهاست که پیمایشگر یافتهاست. مانند کتاب عظیمی که فهرستی را از آنچه پیمایشگرها از صفحات وب یافتهاند، شامل شدهاست. هرگاه سایتی دچار تغییر شود، این فهرست نیز به روز خواهد شد. از زمانی که تغییری در صفحهای از سایت ایجاد شده تا هنگامی که آن تغییر در فهرست جویشگر ثبت شود مدت زمانی طول خواهد کشید. پس ممکن است که یک سایت پیمایششده باشد اما فهرستشده نباشد. تا زمانی که این فهرستبندی برای آن تغییر ثبت نشده باشد، نمیتوان انتظار داشت که در نتایج جستجو آن تغییر را ببینیم. نرمافزار جویشگر، سومین عنصر یک جویشگر است و به برنامهای اطلاق میشود که به صورت هوشمندانهای دادههای موجود در فهرست را دستهبندی کرده و آنها را بر اساس اهمیت طبقهبندی میکند تا نتیجه جستجو با کلمههای درخواست شده هر چه بیشتر منطبق و مربوط باشد.
وقتی شما از جویشگرهای پیمایشی چیزی را برای جستجو درخواست مینمایید، تقریباً بلافاصله این جستجو از میان میلیونها صفحه صورت گرفته و مرتب میشود بطوریکه مربوطترین آنها نسبت به موضوع مورد درخواست شما رتبه بالاتری را احراز نماید. البته باید در نظر داشته باشید که جویشگرها همواره نتایج درستی را به شما ارائه نخواهند داد و مسلماً صفحات نامربوطی را هم در نتیجه جستجو دریافت میکنید و گاهی اوقات مجبور هستید که جستجوی دقیقتری را برای آنچه میخواهید انجام دهید اما جویشگرها کار حیرتانگیز دیگری نیز انجام میدهند. فرض کنید که شما به یک کتابدار مراجعه میکنید و از وی درباره «سفر» کتابی میخواهید. او برای این که جواب درستی به شما بدهد و کتاب مفیدی را به شما ارائه نماید با پرسیدن سؤالاتی از شما و با استفاده از تجارب خود کتاب مورد نظرتان را به شما تحویل خواهد داد. جویشگرها همچنین توانایی ندارند اما به نوعی آنها را شبیهسازی میکنند. پس جویشگرهای پیمایشی چگونه به پاسخ مورد نظرتان از میان میلیونها صفحه وب میرسند؟ آنها یک مجموعه از قوانین را دارند که الگوریتم نامیده میشود. الگوریتمهای مورد نظر برای هر جویشگری خاص و تقریباً سری هستند اما به هر حال از قوانین زیر پیروی میکنند:
یکی از قوانین اصلی در الگوریتمهای رتبهبندی موقعیت و بسامد (تعداد تکرار) واژههایی است که در صفحه مورد استفاده قرار گرفتهاند که بطور خلاصه روش مکان-بسامد (Location/Frequency Methode) نامیده میشود. کتابدار مذکور را به خاطر میآورِد؟ لازم است که او کتابهای در رابطه با واژه «سفر» را طبق درخواست شما بیابد. او در وحله اول احساس میکند که شما به دنبال کتابهایی هستید که در نامشان کلمه «سفر» را شامل شوند. جویشگرها هم دقیقاً همان کار را انجام میدهند. آنها هم صفحاتی را برایتان فهرست میکنند که در برچسب عنوان (Title) موجود در کد زبان نشانهگذاری اَبَرمتنی (زنگام) (HTML) حاوی واژه «سفر» باشند. جویشگرها همچنین به دنبال واژه مورد نظر در بالای صفحات و یا در آغاز بندها (پاراگرافها) هستند. آنها فرض میکنند که صفحاتی که حاوی آن واژه در بالای خود و یا در آغاز بندها و عناوین باشند به نتیجه مورد نظر شما مربوطتر هستند. بسامد عامل بزرگ و مهم دیگری است که جویشگرها از طریق آن صفحات مربوط را شناسایی مینمایند. جویشگرها صفحات را تجزیه کرده و با توجه به تکرار واژهای در صفحه متوجه میشوند که آن واژه نسبت به دیگر واژهها اهمیت بیشتری در آن صفحه دارد و آن صفحه را در درجه بالاتری نسبت به صفحات دیگر قرار میدهند.
چگونگی کارکرد دقیق جویشگرها درباره روشهایی از قبیل مکان-تکرار فاش نمیشود و هر جویشگری روش ویژه? خود را دنبال میکند. به همین دلیل است که وقتی شما واژههای همانندی را در موتورهای متفاوت جستجو میکنید، به نتایج متفاوتی میرسید. الگوریتمهای اولیه جویشگرهای معتبر و بزرگ همچنان محرمانه نگهداری میشوند. برخی جویشگرها نسبت به برخی دیگر صفحات بیشتری را فهرست کردهاند. نتیجه این خواهد شد که هیچ جویشگری نتیجه جستجوی مشترکی با موتور دیگر نخواهد داشت و شما نتایج متفاوتی را از آنها دریافت میکنید. جویشگرها همچنین ممکن است که برخی از صفحات را از فهرست خود حذف کنند البته به شرطی که آن صفحات با هرزنامه (Spam) شدن سعی در گول زدن جویشگرها داشته باشند. فرستادن هرزنامه (Spamming) روشی است که برخی از صفحات برای احراز رتبه بالاتر در جویشگرها در پیش میگیرند و آن به این صورت است که با تکرار بیش از حد واژهها و یا بزرگ نوشتن یا بسیار ریز نوشتن متنها بطور عمدی کوشش در بر هم زدن تعادل و در نتیجه فریب جویشگرها دارند. آنها سعی دارند که با افزایش عامل تکرار، در رتبه بالاتری قرار بگیرند. البته آنگونه که گفته شد تعداد تکرارها اگر از حد و اندازه خاصی فراتر رود نتیجه معکوس میدهد. جویشگرها راههای متنوعی برای جلوگیری از فرستادن هرزنامه دارند و در این راه از گزارشهای کاربران خود نیز بهره میبرند. امروزه بهینهسازی سایتهای اینترنت برای جویشگرها یکی از مهمترین روشهای جلب بازدیدکننده به سایت است.
جویشگرهای گردشی اکنون تجربه فراوانی در رابطه با وبدارهایی دارند که صفحات خود را برای کسب رتبه بهتر مرتباً بازنویسی میکنند. بعضی از وبدارها (وبمسترها)ی خبره حتی ممکن است به سمت روشهایی مانند مهندسی معکوس برای کشف چگونگی روشهای مکان-تکرار بروند. به همین دلیل، تمامی جویشگرهای معروف از روشهای امتیازبندی «خارج از صفحه» استفاده میکنند. عوامل خارج از صفحه عواملی هستند که از تیررس وبدارها خارجند و آنها نمیتوانند در آن دخالت کنند و مسأله مهم در آن تحلیل ارتباطات و پیوندهاست. به وسیله تجزیه صفحات، جویشگرها پیوندها را بررسی کرده و از محبوبیت آنها میفهمند که آن صفحات مهم بوده و شایسته ترفیع رتبه هستند. به علاوه تکنیکهای پیشرفته به گونهای است که از ایجاد پیوندهای مصنوعی توسط وبدارها برای فریب جویشگرها جلوگیری مینماید. علاوه بر آن جویشگرها بررسی میکنند که کدام صفحه توسط یک کاربر که واژهای را جستجو کرده انتخاب میشود و سپس با توجه به تعداد انتخابها، رتبه صفحه مورد نظر را تعیین کرده و مقام آن را در نتیجه جستجو جابهجا مینمایند.
کلمات کلیدی: